法律文本经常使用难以理解的概念。律师在其他事物仔细研究他们过去习惯的情况下,阐述了这种概念的含义。寻找以有用方式提及特定概念的文本片段是乏味,耗时的,因此,昂贵。我们组装了一个来自法律案例决策的26,959个句子的数据集,并在他们解释所选法律概念的实用性方面标记它们。使用DataSet我们研究了基于Transformer的模型的有效性,在大型语言语料上进行了预先培训,以检测哪些句子是有用的。根据模型的预测,我们分析了解释性句子的各种语言特性,以及他们与需要解释的法律概念的关系。我们表明,基于变压器的模型能够学习令人惊讶的复杂功能,优于前进的任务方法。
translated by 谷歌翻译